самит - главные новости

самит - последние новости часа

+13679
Мы знаем, что чесать комариные укусы нельзя, но рука почти всегда делает наоборот. Новое исследование объясняет, что происходит с кожей.
Сооснователь Ethereum Виталик Бутерин подвел итоги встречи исследователей сети в Берлине, которая состоялась через две недели после обсуждений с командами разработчиков на Шпицбергене. Он опубликовал обновленную дорожную карту развития Ethereum (strawmap), в которой очертил масштабную многолетнюю трансформацию протокола. Lean Ethereum станет третьей большой эволюцией сети По словам Бутерина, концепция Lean Ethereum не является отдельным обновлением, а представляет собой серию изменений, которые будут внедряться в течение трех-четырех лет. Среди главных н

Все новости, где упоминается самит

Ахиллесова пята ИИ: простая задача, обнажившая слабости всех языковых моделей — решено в OpenAI o1 - habr.com
habr.com
64%
166
Ахиллесова пята ИИ: простая задача, обнажившая слабости всех языковых моделей — решено в OpenAI o1
Сегодня вышла новая модель от OpenAI o1-preview. Попробовал хитрые (для LLM и не очень для людей) задачки из Linguistic Benchmark Questions вроде той что на картинке или «У Алисы есть N братьев и M сестер. Сколько сестер у брата Алисы?». Новая OpenAI o1-preview решает. Буквально месяц назад на Habr выходила статья-перевод про такие задачи - Ахиллесова пята ИИ: простая задача, обнажившая слабости всех языковых моделей. Вывод был, что это большая проблема, ступор, кризис в отрасли, в комментариях писали, что LLM никогда не превзойдет... и кажется уже можно эту статью удалять. Т.е. есть некоторый шанс что новую модель просто обучили на этом самом Linguistic Benchmark Questions, а с уникальными новыми вопросами она справится хуже, но похоже она и действительно неплохо рассуждает (83% задач на отборочных экзаменах Международной математической олимпиады и 89 процентиль в Codeforces по заявлениям OpenAI ). Подождем более глубоких и широких сторонних исследований.
DMCA