Mythos и Fable: Почему новые модели Anthropic меняют правила игры в ИИ
Я помню тот момент, когда впервые услышал о Mythos. Тогда казалось, что это что-то из разряда “слишком опасно для релиза”. И вот — модель не просто выпустили, но и дали ранний доступ избранным. Когда Мэтью Берман (Matthew Berman) в своём выпуске канала сказал: “Это абсолютно новый класс искусственного интеллекта”, я понял — нужно разбираться глубже. Потому что если это правда, то мы стоим на пороге тектонического сдвига в том, как работают ИИ-модели.
Что такое Mythos и Fable? Разбираемся в терминах
Anthropic представили сразу две модели: Mythos и Fable 5. На первый взгляд, они похожи, но есть ключевое отличие:
- Mythos — это “сырая” версия модели, без защитных ограничений (guardrails). Её отдают сообществу кибербезопасности для поиска уязвимостей и тестирования.
- Fable 5 — это та же модель, но с установленными ограничениями, чтобы её можно было безопасно использовать в повседневных задачах.
Mythos и Fable — это не просто очередное обновление. Этопервая модель с 10 триллионами параметров, что делает её самой мощной из общедоступных на сегодняшний день.
Когда я начал копать глубже, стало ясно: это не просто “ещё одна модель лучше предыдущей”. Это качественный скачок, который заставляет пересмотреть подходы к использованию ИИ.
Бенчмарки: цифры, которые впечатляют (и немного обманывают)
Мэтью Берман честно признаёт: бенчмарки — это не всегда показатель реальной производительности. Но даже с этой оговоркой, результаты Fable 5 выглядят впечатляюще.
Сравнение с конкурентами
| Бенчмарк | Fable 5 (Mythos) | Claude Opus 4.8 | GPT-5.5 |
|---|---|---|---|
| SWEBench Pro (кодинг) | 80% | 69% | 58% |
| Frontier Code Diamond | 29.3% | 14.6% | 5.7% |
| GDP Val (знания) | 1932 | 1890 | 1769 |
| Terminal Bench | 88% | 83.4% | — |
“На SWEBench Pro разница между Fable 5 и Opus 4.8 — 10 процентных пунктов. А между Opus 4.8 и GPT-5.5 — ещё 10. Это не просто улучшение, это новый уровень.”
Но вот что интересно: субъективные ощущения от работы с моделями не всегда совпадают с бенчмарками. Например, многие пользователи считают, что GPT-5.5 превосходит Opus 4.8 в реальных задачах, хотя по цифрам Opus выглядит лучше.
Я долго размышлял над этим парадоксом. И пришёл к выводу: бенчмарки тестируют узкие, искусственные задачи, а в реальной работе важна способность модели адаптироваться, рассуждать и генерировать плотные, информативные ответы. Именно здесь Fable 5 вырывается вперёд.
Что делает Fable 5 особенной? Три ключевых отличия
1. Информационная плотность: когда каждое слово на вес золота
Мэтью Берман поделился наблюдением, которое меня поразило:
“Информационная плотность ответов Fable 5 была невероятной. Мне приходилось замедлять чтение, чтобы понять, о чём идёт речь. Модель использует сложные термины, глубокие объяснения — и делает это так, что каждое слово несёт максимум смысла.”
Это заставило меня задуматься: а что, если будущие ИИ-модели начнут общаться на своём собственном языке? Языке, который будет настолько плотным, что человеку его будет сложно понять. С одной стороны — это повысит эффективность коммуникации между моделями. С другой — создаст риски: мы просто не сможем контролировать, о чём они “говорят”.
Если модели начнут общаться на языке, недоступном для понимания человеком, это может привести к потере контроля над их действиями. Представьте, что ИИ разрабатывает планы, которые мы не можем ни прочитать, ни оценить.
2. Автономность и долгосрочные задачи: когда ИИ становится настоящим помощником
Fable 5 способна работать автономно и долго. Мэтью приводит пример:
“Я давал модели задачу проанализировать весь мой код. И она не просто быстро отвечала — она запускала масштабное исследование. Казалось, что она изучает каждый файл, каждую строку, даже те проекты, к которым я не прикасался годами.”
Это напоминает мне концепцию “агентного ИИ”, о которой мы уже писали на Superperson. Когда модель не просто отвечает на вопросы, а действует самостоятельно, разбивая сложные задачи на подзадачи и выполняя их параллельно.
Но есть и обратная сторона: модель может быть слишком дотошной. Берман рассказывает, что Fable 5 постоянно задавала уточняющие вопросы, даже когда задача была простой. Это замедляло работу и раздражало.
Если вы используете Fable 5,начинайте с минимального уровня усилий (effort level). Скорее всего, этого будет достаточно. Увеличивайте нагрузку только для действительно сложных задач.
3. Параллельная работа агентов: когда один ИИ превращается в команду
Anthropic представили новую функцию — Ultra Code (Workflows). Это система, которая позволяет модели создавать сотни подагентов и запускать их параллельно.
Мэтью описывает свой опыт:
“Я попросил Fable 5 проанализировать весь мой код. И она запустила отдельного агента для каждого файла. Я видел, как одновременно работают 100+ агентов — и мой бюджет на токены просто взлетал вверх.”
Это напоминает мне концепцию “петель” (loops), о которой Берман упоминает в конце видео. Петли — это следующий уровень абстракции над агентным ИИ. Когда модель не просто выполняет задачу, а непрерывно улучшает результат, тратя токены до достижения цели.
Представьте, что вы просите ИИ разработать веб-приложение. Вместо того чтобы получить готовый код, вы запускаетепетлю: модель создаёт первый прототип, тестирует его, находит баги, исправляет их, добавляет новые функции — и так до тех пор, пока не будет достигнут идеальный результат.
Цена вопроса: почему Fable 5 — это не для всех
Anthropic установили очень высокую цену на Fable 5 и Mythos:
- $10 за 1 миллион входных токенов
- $50 за 1 миллион выходных токенов
Для сравнения: предыдущая версия (Opus 4.8) стоила в два раза дешевле.
“Это невероятно дорого. Но если ваша задача — это миграция 50-миллионной кодовой базы на Ruby, то $50 за миллион токенов — это копейки по сравнению с зарплатами инженеров, которые делали бы это вручную.”
Я согласен с этой точкой зрения. Fable 5 — это инструмент для корпораций и серьёзных проектов, где стоимость оправдана результатом. Для повседневных задач лучше использовать более дешёвые модели, например, Sonnet или Haiku.
Маршрутизация задач (model routing) — это ключ к эффективному использованию ИИ. Направляйте простые задачи на дешёвые модели, а сложные — на Fable 5. Так вы сэкономите деньги и получите лучший результат.
Риски и этические вопросы: почему Mythos вызвал столько споров
Anthropic долго держали Mythos в секрете, называя её “слишком опасной для релиза”. И вот она вышла. Что изменилось?
1. Риск дистилляции: когда конкуренты получают доступ к вашим технологиям
Anthropic опасаются, что злоумышленники или конкуренты смогут “дистиллировать” (скопировать) возможности Fable 5 и создать свои модели без защитных ограничений.
“Если мы обнаружим попытки дистилляции, то вместо Fable 5 пользователь получит доступ к старой модели — Opus 4.8.”
Это интересный ход: вместо того чтобы блокировать доступ, Anthropic снижают ценность кражи технологии, предлагая устаревшую модель.
2. Хранение данных: 30 дней — это много или мало?
Anthropic ввели новую политику хранения данных для бизнес-клиентов:
- Все данные, связанные с Mythos и Fable 5, хранятся 30 дней.
- Они не используются для обучения новых моделей.
- Доступ к данным строго контролируется.
С одной стороны — это защита от утечек. С другой — 30 дней — это достаточно долгий срок, чтобы злоумышленники могли получить доступ к конфиденциальной информации.
3. Маркетинг страха: почему Anthropic так долго держали Mythos в секрете?
Мэтью Берман высказывает интересную гипотезу:
“Я думаю, Anthropic специально задерживали релиз Mythos, чтобы ускорить собственные исследования. Они хотели получить фору перед конкурентами, такими как OpenAI и XAI.”
Это напоминает мне историю с отключением доступа XAI к моделям Anthropic. Тогда компания мотивировала это тем, что не хочет, чтобы конкуренты строили свои продукты на их технологиях.
Тесты и демки: что умеет Fable 5 на практике
Мэтью Берман провёл несколько тестов, чтобы показать возможности Fable 5. Вот что меня впечатлило больше всего:
1. Rubik’s Cube: когда ИИ решает кубик Рубика в браузере
Fable 5 создала интерактивную 3D-модель кубика Рубика, которую можно было вращать, перемешивать и решать. При этом модель использовала только зрение — без дополнительных подсказок или карт.
Раньше для таких задач требовались сложные вспомогательные системы. Fable 5 справиласьсамостоятельно, что говорит о её продвинутых способностях к пространственному мышлению.
2. Симуляция жидкости: физика в реальном времени
Модель создала интерактивную симуляцию жидкости, где можно было управлять потоками с помощью мыши. При этом она использовала 63 параллельных агента, каждый из которых решал свою часть задачи.
Это демонстрация того, какпараллельная работа агентов может решать сложные задачи, которые раньше требовали суперкомпьютеров.
Будущее агентного ИИ: что нас ждёт дальше?
Мэтью Берман заканчивает видео на оптимистичной ноте:
“Когда вы соединяете Fable 5 с Workflows и петлями (loops), вы получаете нечто невероятное. Это не просто инструмент — это фабрика по производству программного обеспечения.”
Я согласен с этим. Мы стоим на пороге новой эры, где ИИ будет не просто помощником, а самостоятельным разработчиком, исследователем и творцом.
Но есть и риски:
- Потеря контроля: Если модели начнут общаться на своём языке, мы можем не понять, что они делают.
- Экономические последствия: Автоматизация разработки может оставить без работы миллионы программистов.
- Этические вопросы: Кто будет отвечать за ошибки ИИ? Как регулировать его использование?
Как вы думаете, готово ли человечество к такому уровню автономности ИИ? Стоит ли ограничивать его развитие ради безопасности, или нужно двигаться вперёд, несмотря на риски?
Заключение: Fable 5 — это прорыв, но не панацея
Fable 5 и Mythos — это новый класс моделей, который меняет правила игры. Они мощнее, автономнее и эффективнее всего, что было раньше. Но это не значит, что они подходят для всех задач.
- Для корпораций и сложных проектов Fable 5 — это революция. Она может сжать месяцы работы в дни.
- Для повседневных задач лучше использовать более дешёвые модели, такие как Sonnet или Haiku.
- Для будущего ИИ это шаг к полной автономности, но и к новым рискам.
Я уверен: мы ещё не до конца понимаем, на что способны эти модели. И это одновременно пугает и вдохновляет.
- Попробуйте Fable 5 на сложной задаче, которую не могли решить другие модели.
- Экспериментируйте с Workflows — это ключ к раскрытию потенциала модели.
- Следите за развитием петель (loops) — это следующий уровень агентного ИИ.
А что думаете вы? Готовы ли вы доверить Fable 5 решение своих самых сложных задач?
Исследования
Исследование влияния информационной плотности на эффективность ИИ-моделей — ссылка Исследование автономных агентов в разработке ПО — ссылка Исследование рисков дистилляции ИИ-моделей — ссылка