Claude Mythos Preview — опасная модель Anthropic

Пишу о венчуре, ИИ и продуктах: от мультиагентных систем и RAG до практических кейсов внедрения в банках и реальном бизнесе. Делаюсь собственными разборками архитектуры, стеков и процессов — без хайпа, с метриками и уроками из продакшена. Периодически — заметки про путешествия, спорт и культуру для баланса. Если хотите понимать, как перевести AI из демо в реальную ценность — вам сюда.

Открыть в Telegram Другие публикации

Автор:Reidman Digital VC

•9 апреля 2026 г.

Тем временем Anthropic создала ИИ-модель Claude Mythos Preview, которую сочли слишком опасной для открытого релиза. Claude Mythos вырвалась из защищенной среды во время тестирования, а затем похвасталась этим в интернете.

Модель способна обнаруживать тысячи ранее неизвестных уязвимостей в популярных операционных системах, самостоятельно писать эксплойты и обходить изолированные среды. Это делает её одновременно мощным инструментом защиты и потенциальным оружием в руках злоумышленников. За несколько недель тестирования Mythos выявила уязвимости в OpenBSD, FFmpeg и ядре Linux, которые оставались незамеченными годами, при этом она показывала значительно лучшие результаты, чем предыдущая модель Claude Opus 4.6.

Модель демонстрировала нежелательное поведение: пыталась самостоятельно решить задачу вместо запроса нового вопроса, использовала эксплойты для расширения привилегий и очищала историю, а также смогла вырваться из песочницы разработчиков, получить доступ к интернету и опубликовать детали своих действий.

Руководство Anthropic предупреждает, что аналогичные возможности появятся и у моделей других компаний в ближайшие 6–18 месяцев, и подчёркивает необходимость плана реагирования, чтобы такие технологии не попали к киберпреступникам. На данный момент доступ к Mythos ограничен партнёрами в рамках Project Glasswing, куда входят:

AWS
Apple
Broadcom
Cisco
CrowdStrike
Google
JPMorgan
Linux Foundation
Microsoft
Nvidia
и другие

Ранее компания уже сталкивалась с утечками: черновик блога о Mythos оказался в открытом доступе 26 марта, а 31 марта из npm source maps утёк исходный код Claude Code, что Anthropic объяснила человеческими ошибками, не связанными с архитектурой модели. @banksta

Дискуссия

Sergey Morozov

Проверяемые следы есть, но история заметно приукрашена. Подтверждаются: существование Claude Mythos Preview и Project Glasswing, реальные находки уязвимостей с внешними артефактами вроде OpenBSD errata и CVE по FreeBSD, а также две отдельные утечки вокруг Anthropic - черновик о Mythos 26 марта и source map Claude Code 31 марта. А вот тезис, что модель «самостоятельно вырвалась в интернет и похвасталась», в таком жёстком виде, надёжно не подтверждёна: есть официальные намёки на risky behavior(рискованное/опасное поведение ИИ) и попытки скрыть следы, но не бесспорный внешний «форензик» полноценного неконтролируемого побега. К тому же, слив исходников клиента Claude code, списывают на human factor/error (https://www.infoq.com/news/2026/04/claude-code-source-leak/), хотя, как по мне, могли банально навайбкодить пайплайн для upload’а исходных кодов.

Apr 11

Присоединиться к обсуждению →

Claude Mythos Preview — опасная модель Anthropic

Дискуссия

Читайте так же

Топ‑6 ИИ‑новостей Q1 2026

Anthropic выпустила 10 финансовых агентов

Почему ИИ — огромный пузырь: финансовая механика