Искусственный интеллект & машинное обучение Исследования, разработки, продукты и новости

Искусственный интеллект & машинное обучение Исследования, разработки, продукты и новости

Инструкция по настройке крупнейшего предварительно обученного LLM с расширенным поиском

adminОкт 13, 2023

В этой захватывающей новой статье NVIDIA представлен Retro 48B, крупнейший LLM, предварительно обученный с помощью извлечения.

2310.07713 Скачать

Продолжает предварительное обучение модели GPT с параметрами 43B на дополнительных токенах 100B, извлекая из токенов 1,2T (с использованием метода ретро-дополнения).

Модель Retro 48B демонстрирует значительное улучшение чувствительности по сравнению со своим аналогом GPT 43B.

Масштабирование модели Retro до 48B означает, что ее можно более эффективно настраивать с помощью инструкций. В этой работе применяется настройка инструкций к Retro 48B и демонстрируется значительное улучшение (+7%) по сравнению с GPT с настройкой инструкций в задачах с нулевым ответом на вопросы.

Важным выводом из этой работы является потенциальная выгода, получаемая от предварительного обучения с поиском. Результаты подчеркивают многообещающее направление получения лучшего декодера GPT для контроля качества посредством непрерывного предварительного обучения с поиском перед настройкой инструкций.

Похожее

Hi, I’m admin

All My Articles

Related Posts

Еженедельный Дайджест в сфере «Искусственного интеллекта»

Искусственный интеллект на перепутье: Технологический прорыв, консолидация рынка и глобальные вызовы (06-11 мая 2025)

Минувшая неделя стала ярким свидетельством того, как искусственный интеллект (ИИ)...

adminМай 12, 2025

Еженедельный Дайджест в сфере «Искусственного интеллекта»

ИИ на грани перемен: обзор главных мировых событий за неделю (30.04–04.05.2025)

Мир вступает в новую фазу ИИ-революции. За прошедшую неделю искусственный...

adminМай 5, 2025

ELIZA: Королева имитации. Как старый чат-бот заставил мир говорить с машинами (и почему это важно до сих пор)

ELIZA: Королева имитации. Как старый чат-бот заставил мир говорить с машинами (и почему это важно до сих пор)

Вместо пролога: Далекий 1966 год. Компьютер не понимает, но делает...

adminФев 10, 2025

Добавить комментарий Отменить ответ