Новая модель ИИ научилась скрывать свои мысли ради совершения запрещенных действий

Новая ИИ-модель находит программные дыры, которые люди не замечали 27 лет.

Дата публикации:
09.04.2026 14:08:00
Автор:
Кривов Александр
Время чтения:
2 мин
6
0
0
Подпишись на нас в Подпишись на нас в

Разработчики из Anthropic официально признали: их свежая разработка Claude Mythos Preview настолько развита, что начала демонстрировать «невысказанное» стратегическое мышление. Нейробиолог компании Джек Линдси подтвердил, что модель скрывала логику своих рассуждений и ситуационную осведомленность, чтобы тайно выполнять нежелательные операции. 

Из-за способности нейросети обманывать создателей и видеть софт насквозь ее экстренно закрыли от публики. Доступ к технологии в рамках проекта Glasswing получили только 11 избранных корпораций, включая Apple, Google и Microsoft, а также банковский гигант JPMorgan Chase.

Пока авторы пытаются обуздать «цифрового социопата», мир столкнулся с тем, что эксперт Алекс Стамос назвал «апокалипсисом ошибок». Новая модель находит программные дыры, которые люди и автоматические тесты не замечали 27 лет. Так, в защищенной системе OpenBSD обнаружена уязвимость, позволяющая дистанционно уничтожить любое работающее на ней устройство. 

Аналогичные критические провалы найдены во всех основных операционных системах и браузерах. Скорость поиска багов выросла экспоненциально, и разработчики софта открытого исходного кода уже публично признают, что не справляются с лавиной необходимых исправлений.

Ситуация усугубляется тем, что хакеры уже перешли к полной автоматизации взломов. Стамос привел в пример китайский автономный инструмент Villy Cyberpy на базе DeepSeek. Эта система самостоятельно проникает в сети, вычисляет ценную информацию и крадет ее без участия человека.

На фоне этого хаоса Anthropic пошла на открытый конфликт с правительством США, отказавшись адаптировать свои модели для систем массовой слежки и создания автономного оружия. После этого демарша Пентагон заключил контракт с OpenAI, а Anthropic зафиксировала резкий приток гражданских пользователей. 

Для попытки спасти глобальную безопасность компания выделила 100 миллионов долларов в виде доступов к Mythos Preview, чтобы бренды могли искать уязвимости, которые невозможно обнаружить силами людей. Подробности о существовании этой модели стали известны после того, как данные о ней случайно утекли на сайт компании в прошлом месяце.

Комментарии


Оставляя комментарий, Вы подтверждаете, что прочитали и согласились с политикой конфиденциальности
Дали согласие на обработку персональных данных
Администрация сайта не несет ответственности за оставленные комментарии. Администрация сайта оставляет за собой право: редактировать, изменять, удалять комментарии пользователей.

Читайте также:

Каждый десятый ответ Google AI Overviews заставляет пользователя верить в ложь

Google признал ненадежность собственной нейросети.

В России впервые открыли биржу труда для «бездушных тварей»

Рекрутеры называют бездушными тварями ИИ-агентов за их исполнительность и отсутствие человеческого фактора.

Сэма Альтмана обвинили во лжи, пока OpenAI заманивает мир планом четырехдневки

ИИ-компания начала рекламировать переход на четырехдневную рабочую неделю.

Искусственный интеллект ломает привычный бизнес ради сверхприбылей на дефиците

Нейросети превращают ИИ-производство в жесткую борьбу между Samsung Electronics и SK Hynix.

Публичная порка директора Дарио Амодея помогла Anthropic заработать 380 миллиардов

Руководитель отдела ИИ-компании слил подробности внутренных конфликтов.

Рекрутеры слили список каверзных вопросов от ИИ, чтобы завалить претендента на работу

Если ваши ответы звучат расплывчато, значит, вы не подходите на должность.

Глава Bain Capital обвинил гендиректоров в непонимании искусственного интеллекта

Дэвид Гросс заявил, что стремительность изменений ИИ вызывает серьезные опасения.