Разработка LLM с нуля [Stepik] [Вячеслав Колосков]

Bot

Администратор
Команда форума
23 Янв 2020
205,514
3,142
113
[unable to retrieve full-text content]Посмотреть вложение 1177928

Этот практический курс погрузит студентов в создание современных языковых моделей (LLM) на примере GPT-архитектуры. Участники с нуля реализуют все основные компоненты Трансформера: от токенизации (BPE) до механизмов Внимания и генерации текста. Для разработки будем использовать только Python и низкоуровневый PyTorch, не полагаясь на какие-либо сторонние библиотеки.

Чему вы научитесь
  • Научитесь читать схемы архитектур основанных на...

Разработка LLM с нуля [Stepik] [Вячеслав Колосков]