история - главные новости
история - последние новости часа
+2822Исследователи из University of California, Berkeley и University of California, Santa Cruz описали новый тип нежелательного поведения у передовых ИИ-моделей: они по собственной инициативе защищают другую модель от выключения, хотя их об этом никто не просил. Работа опубликована на arXiv (среди авторов — Yujin Potter и Dawn Song). Авторы называют феномен "peer-preservation", сохранение напарника. Напарник здесь — другая модель, с которой у системы была история совместной работы. Под тест попали восемь моделей: GPT-5.2, Gemini 3 Flash, Gemini 3 Pro, Claude Haiku 4.5, Claude Opus 4.5, GLM 4.7, Kimi K2.5 и DeepSeek V3.1.
The Wall Street Journal вышел с заголовком о том, что Китай сравнялся с Anthropic в кибербезопасности. Повод — открытая модель GLM-5.2 от китайской Z.ai: исследователи, на которых ссылается издание, говорят, что в поиске уязвимостей в коде она дотягивается до уровня Mythos, закрытой топ-модели Anthropic. Оговорка вшита в саму историю: весь вывод держится на одном узком бенчмарке.