gemini - главные новости

gemini - последние новости часа

+1033
MiniMax M3 вышла сегодня — это мощная языковая модель, которая одновременно предлагает frontier-уровень в кодировании и агентных задачах, контекст до 1 миллиона токенов и нативную мультимодальность (изображения, видео + управление компьютером). По словам компании, среди моделей с открытыми весами она первая с таким полным набором возможностей.
Стартап Emergence AI запустил исследовательскую лабораторию Emergence World и поставил необычный эксперимент: пять параллельных симуляций общества, в каждой из которых десять автономных ИИ-агентов жили в общем виртуальном городе на протяжении 15 дней. Условия во всех пяти мирах были идентичны, менялась только модель, на которой работали агенты: где-то это был Claude Sonnet 4.6, где-то Grok 4.1 Fast, Gemini 3 Flash или GPT-5-mini, а в пятом мире уживались агенты от разных вендоров.

Все новости, где упоминается gemini

runawayllm - Доработанная GPT-5 Pro достигла человеческого уровня в сложном бенчмарке ARC-AGI-1 - habr.com
habr.com
77%
344
Доработанная GPT-5 Pro достигла человеческого уровня в сложном бенчмарке ARC-AGI-1
Исследователь Джереми Берман сообщил, что разработанная им мультиагентная система на базе GPT-5 Pro показала 88 из 100 на случайной выборке задач из бенчмарка ARC-AGI-1 при средней стоимости порядка 27 долларов за задачу и суммарном времени прогона около 12 часов. Берман подчеркивает, что результат еще предстоит проверить на скрытом наборе ARC Prize; в его прошлых экспериментах официальная верификация обычно снижала итог на несколько пунктов и слегка увеличивала стоимость. С этой оговоркой автор ожидает, что итоговый скор окажется вблизи ориентирной планки «human-level» около 85%. Стоит отметить, что системы Бермана регулярно достигали лидирующих позиций в бенчмарках ARC, так что его слова заслуживают доверия.
denis19 - Эксперт по ИБ из Cybernews выяснил, что советы от ChatGPT, Claude и Gemini подвергают угрозам безопасность домашней сети - habr.com
habr.com
54%
491
Эксперт по ИБ из Cybernews выяснил, что советы от ChatGPT, Claude и Gemini подвергают угрозам безопасность домашней сети
Эксперт по ИБ из Cybernews рассказал, что ответы чат-ботов ChatGPT, Claude 4.5 и Gemini 2.5 Pro существенно подвергают угрозам безопасность домашней сети, предлагая запуск от root, дефолтные пароли и незащищённые способы сетевого соединения, при попытке выяснить у ИИ-систем, как можно упростить работу с домашней сетью и повысить уровень её безопасности. Оказалось, что штатно чат-боты дают рекомендации, которые могут открыть локальные сервисы пользователя всему интернету и привести к сетевому коллапсу работу ПК и других домашних систем, так как не учитывают критические уязвимости в различных системах и не считают, что на первом плане должна соблюдаться необходимость скрытия данных домашних сетей от взлома.
DMCA