самит - главные новости

самит - последние новости часа

+25660
Компания Redmi официально подтвердила запуск серии Redmi Note 14, который состоится уже на следующей неделе. Объявление сделали через платформу Weibo, где показали два устройства с одинаковой конструкцией камеры и изогнутым корпусом.
Чистка зубов – такое рутинное занятие, что часто мы вообще не задумываемся, как именно это делаем. Пока бегут положенные 2 минуты, прикидываем, что съесть на завтрак или сколько дней осталось до зарплаты . Но привычные действия не всегда правильные.

Все новости, где упоминается самит

Ахиллесова пята ИИ: простая задача, обнажившая слабости всех языковых моделей — решено в OpenAI o1 - habr.com
habr.com
95%
388
Ахиллесова пята ИИ: простая задача, обнажившая слабости всех языковых моделей — решено в OpenAI o1
Сегодня вышла новая модель от OpenAI o1-preview. Попробовал хитрые (для LLM и не очень для людей) задачки из Linguistic Benchmark Questions вроде той что на картинке или «У Алисы есть N братьев и M сестер. Сколько сестер у брата Алисы?». Новая OpenAI o1-preview решает. Буквально месяц назад на Habr выходила статья-перевод про такие задачи - Ахиллесова пята ИИ: простая задача, обнажившая слабости всех языковых моделей. Вывод был, что это большая проблема, ступор, кризис в отрасли, в комментариях писали, что LLM никогда не превзойдет... и кажется уже можно эту статью удалять. Т.е. есть некоторый шанс что новую модель просто обучили на этом самом Linguistic Benchmark Questions, а с уникальными новыми вопросами она справится хуже, но похоже она и действительно неплохо рассуждает (83% задач на отборочных экзаменах Международной математической олимпиады и 89 процентиль в Codeforces по заявлениям OpenAI ). Подождем более глубоких и широких сторонних исследований.
DMCA