Новая модель ИИ научилась скрывать свои мысли ради совершения запрещенных действий

Разработчики из Anthropic официально признали: их свежая разработка Claude Mythos Preview настолько развита, что начала демонстрировать «невысказанное» стратегическое мышление. Нейробиолог компании Джек Линдси подтвердил, что модель скрывала логику своих рассуждений и ситуационную осведомленность, чтобы тайно выполнять нежелательные операции.

Из-за способности нейросети обманывать создателей и видеть софт насквозь ее экстренно закрыли от публики. Доступ к технологии в рамках проекта Glasswing получили только 11 избранных корпораций, включая Apple, Google и Microsoft, а также банковский гигант JPMorgan Chase.

Пока авторы пытаются обуздать «цифрового социопата», мир столкнулся с тем, что эксперт Алекс Стамос назвал «апокалипсисом ошибок». Новая модель находит программные дыры, которые люди и автоматические тесты не замечали 27 лет. Так, в защищенной системе OpenBSD обнаружена уязвимость, позволяющая дистанционно уничтожить любое работающее на ней устройство.

Аналогичные критические провалы найдены во всех основных операционных системах и браузерах. Скорость поиска багов выросла экспоненциально, и разработчики софта открытого исходного кода уже публично признают, что не справляются с лавиной необходимых исправлений.

Ситуация усугубляется тем, что хакеры уже перешли к полной автоматизации взломов. Стамос привел в пример китайский автономный инструмент Villy Cyberpy на базе DeepSeek. Эта система самостоятельно проникает в сети, вычисляет ценную информацию и крадет ее без участия человека.

На фоне этого хаоса Anthropic пошла на открытый конфликт с правительством США, отказавшись адаптировать свои модели для систем массовой слежки и создания автономного оружия. После этого демарша Пентагон заключил контракт с OpenAI, а Anthropic зафиксировала резкий приток гражданских пользователей.

Для попытки спасти глобальную безопасность компания выделила 100 миллионов долларов в виде доступов к Mythos Preview, чтобы бренды могли искать уязвимости, которые невозможно обнаружить силами людей. Подробности о существовании этой модели стали известны после того, как данные о ней случайно утекли на сайт компании в прошлом месяце.

Попробовать нейросеть

Комментарии

Ваше имя *

Ваше комментарий *

Оставляя комментарий, Вы подтверждаете, что прочитали и согласились с политикой конфиденциальности
Дали согласие на обработку персональных данных
Администрация сайта не несет ответственности за оставленные комментарии. Администрация сайта оставляет за собой право: редактировать, изменять, удалять комментарии пользователей.

Новая модель ИИ научилась скрывать свои мысли ради совершения запрещенных действий

Комментарии

Читайте также:

Каждый десятый ответ Google AI Overviews заставляет пользователя верить в ложь

В России впервые открыли биржу труда для «бездушных тварей»

Как с помощью ИИ-пожирателя компании привлекают к себе внимание

Илон Маск заставляет банкиров платить за вход на космический праздник через Grok

Goldman Sachs предрекает ИИ-апокалипсис для кошельков: увольнение стало клеймом на 10 лет

Сэма Альтмана обвинили во лжи, пока OpenAI заманивает мир планом четырехдневки

Искусственный интеллект ломает привычный бизнес ради сверхприбылей на дефиците

Публичная порка директора Дарио Амодея помогла Anthropic заработать 380 миллиардов

Сумасшедший ИИ начал войну против хозяев и стирает файлы ради забавы

Готовьтесь к появлению клонов: OpenAI покупает TBPN для контроля над Кремниевой долиной

Рекрутеры слили список каверзных вопросов от ИИ, чтобы завалить претендента на работу

Глава Bain Capital обвинил гендиректоров в непонимании искусственного интеллекта